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摘要 随 着 海洋 观测 、 模 拟 手 段 的 快速 提升 和 数据 科学 的 重大 突破 ， 现 代 海 洋 科 学 经 历 了 理论 牵引 、 技 术 驱 动 与 
数据 主导 三 大 范式 变革 ， 海 洋 大 数据 已 成 为 人 类 从 认识 海洋 到 经 略 海洋 的 必 经 之 路 。 文 章 从 海洋 大 数据 的 获取 、 
分 析 及 应 用 ， 上 、 中 、 下 游 全 链条 分 析 了 目前 的 发 展现 状 ， 指 出 现今 将 海洋 科学 领域 与 数据 科学 领域 紧密 结合 ， 
有 效应 对 海洋 发 展 中 科学 、 技 术 、 工 程 、 人 文 等 方面 的 挑战 ， 是 海洋 科研 领域 的 核心 问题 之 一 。 在 此 基础 上 ， 提 
出 了 未 来 5 一 10 年 海洋 大 数据 科学 发 展 的 主要 方向 和 关键 技术 ， 对 于 准确 掌握 海洋 状况 、 提 升 海洋 预测 服务 能 力 、 


维护 国家 海洋 权益 具有 重要 的 现实 意义 和 深远 的 战略 意义 。 
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现代 海洋 科学 的 发 展 古往今来 经 历 了 3 个 阶段 : D 
理论 军 引 阶段 。 该 阶段 的 许多 重大 理论 圆满 地 解释 了 海 
洋 中 的 物理 现象 ， 长 足 推进 了 人 们 对 海洋 的 认识 。 虽 然 
该 阶段 缺少 观测 资料 ， 但 是 发 展 的 理论 基本 都 具有 里 程 
碑 的 意义 。@ 观测 牵引 阶段 。 该 阶段 各 类 观测 手段 逐渐 
发 展 起 来 ， 主 要 包括 海洋 调查 船 、 浮 标 、 潜 水 器 、 遥 感 
WR Argo 监测 网 等 。( 晤 数据 牵引 阶段 。 随 着 观测 技术 
手段 的 不 断 丰 富 ， 也 带 来 了 数据 量 的 不 断 攀 升 ， 海 洋 科 
学 迎 来 了 第 三 阶段 。 从 2008 EFt, Nature. Science. 
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(计算 社区 联盟 ) 等 组 织 将 “大 数据 ”引入 到 各 个 领 
域 "'“%。“ 大 数据 ”被 定义 为 数据 量 增长 速度 快 ， 用 常 
规 的 数据 工具 无 法 在 一 定时 间 内 进行 采集 、 处 理 、 存 
储 和 计算 的 数据 集合 ， 拥 有 数据 量 大 (volume ) 、 类 型 
繁多 (variety) 、 价 值 密度 低 (value) 、 速 度 快 时 效 高 
(velocity ) 和 在 线 式 (online ) 五 大 特征 "。 由 于 海洋 数 
据 的 数据 来 源 广泛 、 种 类 繁多 ， 数 据 量 已 增 至 PB 量 级 ， 
时 间 分 辩 率 跨越 不 同 尺度 ， 同 时 需要 及 时 处 理 分 析 用 于 
各 类 决策 支撑 ， 因 此 海洋 数据 已 然 成 为 “大 数据 ”的 典 


范 。 
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但 是 海洋 大 数据 的 独特 性 质 ， 使 得 传统 的 理论 基 星 ” 号 始 于 1956 年 ,目前 中 国 已 有 共 近 50 艘 海洋 调查 
础 、 技 术 手 段 已 逐渐 暴露 其 弊端 。 海 详 大 数据 有 两 个 区 船 。 目 前 ， 全 球 超过 40 个 国家 拥有 海洋 科 考 船 ， 总 数量 
别 于 其 他 数据 的 典型 特征 超过 500 艘 。 

(1) 时 空 看 合 。 海 洋 大 数据 为 同时 拥有 时 间 与 空间 (2) 海洋 浮标 。 这 是 一 类 用 于 承载 各 类 探测 海洋 和 
属性 的 数据 ， 即 多 维度 数据 。 尤 其 随 着 观测 技术 的 进 一 大气 传感器 的 海上 平台 ， 是 海洋 立体 监测 系统 的 重要 组 
步 发 展 ， 数 据 维度 的 采集 分 辨 率 与 频率 都 越 来 越 高 。 因 成 部 分 ""。 根 据 浮标 在 海上 所 处 位 置 不 同 ， 可 分 为 锚 定 


此 ， 数 据 分 析 过 程 需要 同时 从 时 间 轴 和 空间 轴 两 个 维度 。 ”浮标 、 潜 标 、 漂 流 浮标 等 。 海 洋 错 定 浮标 最 早出 现 于 二 
进行 分 析 ， 而 在 时 间 轴 和 空间 轴 上 分 析 的 因素 又 是 多 样 。“” 战 期 间 ; 20 世纪 70 年 代 后 期 ， 随 着 计算 机 技术 和 卫星 通 


的 、 高 维 的 ， 这 给 大 数据 的 分 析 带 来 了 更 大 的 挑战 V"。 
(2) 地 理 关联 。 海洋 大 数据 不 同 于 其 他 大 数据 的 随 


信和 技术 在 浮标 应 用 中 的 出 现 ， 使 得 浮标 技术 发 展 进 入 了 
飞跃 期 。 海 洋 浮标 在 中 国 的 开发 研制 始 于 20 世纪 60 年 代 
机 性 与 偶然 性 ， 由 于 其 地 理 属 性 有 着 近邻 效应 ， 相 邻 区 中期，90 年 代 开始 正式 投入 使 用 。 目 前 ， 中 国 已 经 进入 
域 空间 位 置 关系 存在 线性 或 非 线 性 的 关联 ， 从 而 组 成 了 了 海洋 浮标 监测 的 大 国 俱乐部 ”…。 
不 同时 空 尺 度 的 模 态 特征 。 (3) 潜水 器 。 又 称 为 深 潜 絮 ， 是 一 种 自 带 推动 力 的 
因此 ， 在 海洋 大 数据 科学 的 发 展 过 程 中 存在 着 诸多 ”海洋 考察 设备 一 一 既 能 在 水 面 行驶 ， 又 能 在 水 下 独立 开 
挑战 。 本 文 将 从 海洋 大 数据 上 、 中 、 下 游 全 链条 论述 海 。 展 工作 ""。1554 年 意大利 人 塔 尔 奇 利 亚 发 明 的 木质 球形 
洋 大 数据 科学 的 发 展现 状 ， 并 在 此 基础 上 提出 未 来 5 一 10 ”潜水 嚣 ， 对 后 来 潜水 器 的 研制 产生 了 巨大 影响 。1717 年 
年 海洋 大 数据 科学 发 展 的 主要 方向 和 关键 技术 。 英国 人 哈雷 设计 了 第 一 个 有 实用 价值 的 潜水 器 ， 此 后 直 
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1 海洋 大 数据 获取 现状 
海洋 大 数据 的 获取 手段 主要 得 益 于 海洋 观测 技术 的 


到 20 世纪 60 年 代 ”， 人 类 对 潜水 器 的 研制 主要 致力 于 下 


潜 深 度 的 突破 。“ 蚁 龙 ” 
研制 的 深海 载 人 洪水 器 ， 目 


号 是 中 国 自 行 设计 、 自 主 集 成 
前 以 下 洪 深 度 7062m， 成 为 
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HA E BYR AEF PR IE My RK AE o 

(4) FER. BEA Ae Be ah TEET 
远 距 离 非 接触 观测 ， 以 获取 海洋 景观 和 海洋 要 素 的 图 
像 或 数据 资料 ; 其 发 展 历程 大 致 可 分 为 起 步 期 ( 1939 一 
试验 期 (1970 一 1977 年 ) 、 研 究 期 (1978 一 
应 用 期 ( 1992 年 至 今 3, 20 世纪 90 年 代 ， 


发 展 。 目 前 海洋 观测 呈现 出 多 元 化 、 立 体 化 、 实 时 化 的 
特征 。 从 早期 利用 海洋 调查 船 到 浮标 、 洪 水 器 、 遥 感 的 
使 用 ， 再 到 海洋 观测 网 Argo 等 的 实现 ， 无 一 不 展现 了 人 
类 不 断 探 索 海 洋 的 决心 与 智慧 。 

(1) 海洋 调查 船 。 这 是 一 类 专门 从 事 海洋 科学 调 
查 研究 的 船只 ， 是 搭载 海洋 仪器 设备 直接 观测 海洋 、 


1969 4E ) 、 
19914F ) 、 


采集 样品 和 研究 海湾 


的 工具 。 海 洋 调查 船 按 其 调查 任 


务 可 分 为 综合 调查 船 、 专 业 调 查 船 以 及 特种 调查 船 ”…”。 
从 世界 上 第 一 艘 海洋 调查 船 “挑战 者 ”号 开始 ， 
已 有 100 多 年 的 历史 。 中 国 第 一 条 海洋 调查 船 “ 金 


k 


遥感 卫星 开始 大 量 发 射 ; RE 2012 年 底 ， 在 轨 卫 星 数量 


为 115 颗 ， 


涉及 超过 30 个 空 


空间 机 构 "-。 预 测 到 2030 年 


还 会 再 有 156 颗 卫 星 发 射 ， 届 时 总 数 将 达到 271 颗 。 
(5) 海洋 观测 网 络 。 美 国 的 Seaweb 是 世界 上 最 早 


(D Spatiotemporal database. [2018-07-20]. http://en.wikipedia.org/wiki/Spatiaotemporal_data base. 
(2) AUV. [2018-07-20]. https://en.wikipedia.org/wiki/Autonomous underwater vehicle. 


(3) 国家 深海 基地 管理 中 心 . [2018-07-20]. http://www.ndsc.org.cn/. 
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部 署 和 应 用 的 海洋 观测 网 络 ; Argo 计划 则 是 由 美国 海洋 
科学 家 于 1998 年 倡导 发 起 的 一 个 监测 全 球 海 洋 的 大 型 
网 络 ， 全 世界 几 十 个 国家 参与 其 中 。 截 至 2018 年 7 月 ， 
布 放 在 全 球 海洋 中 仍 处 于 工作 状态 的 Argo 剖面 浮标 已 
达 3 762 个 "。 未 来 ，Argo 剖面 浮标 将 增加 到 近 4000 个 ; 
在 维持 现 有 Argo 观测 内 容 的 基础 上 ， 新 的 Argo 浮标 观测 
范围 将 扩大 到 海面 2000m 以 下 甚至 海底 ， 同 时 携带 安装 
生物 、 地 球 、 化 学 等 新 型 传感器 。 

在 海洋 大 数据 的 获取 方面 ， 虽 然 已 实现 了 基于 空 基 - 
天 基 - 地 基 - 海 基 的 多 元 立体 实时 化 发 展 ， 但 是 吕 待 突破 深 
海 、 极 端 环 境 和 高 分 状 率 的 大 数据 获取 技术 及 平台 的 发 
展 脉络 ， 同 时 如 何 基于 空间 数据 的 时 空 耦 合 与 地 理 关 联 
特性 ， 面 向 空间 研究 对 象 合理 布设 、 高 效 利 用 观测 手段 
成 为 数据 获取 阶段 的 挑战 。 


2 海洋 大 数据 分 析 技 术 现状 
海洋 大 数据 从 上 游 获取 后 ， 在 中 游 主要 涉及 存储 
理 、 挖 气 及 表达 可 视 化 等 分 析 技术 。 


n 
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取 耗 时 ， 无 法 在 线 直 接 访问 任意 数据 。 


Storm, 、StreamBase Pregel 等 先进 的 并 行 计算 框架 2， 
且 在 各 领域 中 得 到 广泛 应 用 。 海 洋 大 数据 在 信息 挖掘 过 
程 中 也 从 传统 的 经 验 模 态 正 交 法 (EOF ) 发 展 到 了 具有 
空 解 厢 特 性 的 四 维 谐 波 提取 法 (4D-HEM ) “1。 但 是 
由 于 海洋 大 数据 的 时 空 耦合 及 地 理 关 联 特性 ， 导 致 传统 
的 数据 挖掘 算法 无 法 有 效 地 进行 时 空 解 耦 与 地 理 分 解 ， 
使 得 挖掘 算法 成 为 海洋 大 数据 科学 全 链条 运转 环节 中 耿 
待 改进 与 调整 的 重要 屏障 一 。 

(3) 海洋 大 数据 表达 可 视 化 。 利 用 科学 可 视 化 技术 
展示 海洋 数据 以 及 更 进一步 地 利用 可 视 化 分 析 技 术 控 所 
时 空 数据 规律 ， 是 建立 从 感知 到 认 知 的 关键 技术 桥梁 。 
海 详 矢量 场 可 视 化 算法 主要 有 图 表 法 、 几 何 法 “”  、 纹 
BIR PERSE ES AT CIE EK UR 
制 中、 实时 光照 °" 、 多 变量 提 特 征 提取 、 二 维 时 
空 可 视 化 等 方面 都 取得 了 重要 成 果 ”1。 但 是 随 着 海洋 数 
据 体 量 的 继续 增 大 ， 对 可 视 化 表达 方式 、 人 处 理 效能 等 方 


Ti 


(1) 海洋 大 数据 存储 管理 。 世 界 各 主要 海洋 国家 
均 有 负责 数据 处 理 和 管理 的 海洋 数据 中 心 。 美 国 国家 
航空 航天 局 (NASA ) 的 地 球 观 测 中 心 建立 了 地 球 观 测 
系统 数据 和 信息 系统 ， 存 储 和 管理 全 部 数据 ， 采 用 的 是 
分 布 式 开放 的 系统 架构 ; 欧洲 航天 局 (ESA) 也 建立 
了 采取 基于 任务 的 分 布 式 存储 的 数据 中 心 ""。 中 国 目前 
海洋 卫星 遥感 数据 的 存储 采用 由 千 兆 交换 机 连接 构成 
的 NAS (网 络 接 人 存储 ) 三 级 存储 体系 ， 主 要 采用 磁盘 
阵列 加 光盘 存储 的 方式 ""。 国 外 的 海洋 大 数据 存储 采用 
了 逮 辑 上 集中 ， 物 理 上 分 散 的 分 布 式 服 务 器 集群 存储 架 
Vg; 而 国内 的 海洋 大 数据 还 属于 地 域 上 的 集中 式 服务 器 
存储 一 一 随 着 数据 量 的 增长 ， 在 线 存储 资源 有 限 ， 难 以 
实现 在 线 存储 资源 的 动态 扩展 和 灵活 配置 ， 离 线 数据 获 


(4) Argo. [2018-07-20]. http://www.argo.ucsd.edu/. 
(5) Twitter Storm. [2018-07-20]. http://www.oschina.net/p/twitter-storm. 
(6) Digital Ocean. [2018-07-20]. https://en.wikipedia.org/wiki/DigitalOcean. 
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面 都 提出 了 非常 高 的 要 求 ， 需 要 一 方面 尽 可 能 真实 地 反 
映 数据 的 特性 ， 另 一 方面 充分 提供 系统 的 承载 能 力 和 处 
理 能 力 ， 提 高 数据 的 更 新 和 绘制 能 力 。 

纵 观 国内 外 海洋 大 数据 的 分 析 技 术 研究 ， 中 国 在 数 
据 存储 管理 及 挖掘 方面 仍 处 于 跟 跑 阶段 ， 但 在 可 视 化 分 
析 方 面 已 实现 并 跑 。 


3 海洋 大 数据 应 用 现状 

海洋 大 数据 的 应 用 主要 为 社会 经 济 发 展 及 气候 预测 
等 提供 决策 支撑 。 目 前 ， 世 界 各 国都 在 积极 投入 “数字 
海洋 ”的 建设 ， 并 为 进一步 建设 “智慧 海洋 ”平台 黄 定 
基础 ， 如 美国 和 加 拿 大 制定 的 “海王 星 ” 计 划 、 日 本 的 
“ARANA” 计 划 、 非 洲 沿 海 25 国 的 “非洲 近海 资源 数 
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据 和 网 络 信息 平台 ”以 及 中 国 的 “iOcean” 平 台 等 "。 if 
洋 大 数据 在 气候 预警 报 决策 支撑 方面 ， 主 要 是 建立 在 高 
性 能 集群 基础 上 的 完备 数值 预报 体系 “。 例 如 : 美国 大 
气 海洋 局 (NOAA ) 计划 在 2023 年 推出 WoF ( Warn-on- 
Forecast ) 系统 。 该 系统 可 为 美国 及 其 临近 海域 提供 精细 
化 天 气 预报 和 灾害 预警 一 一 美国 本 土 计算 网 格 大 小 精细 
至 3 一 10km， 全 球 区 域内 网 格 精细 至 15 km; 该 系统 的 计 
算 需 求 高 达 1 万 亿 亿 次 。 中 国 系列 海洋 卫星 产品 在 赤潮 / 
绿 潮 监 测 、 海 冰 监 测 、 渔 业 生产 和 水 质 调查 等 方面 也 得 
到 了 全 面 的 业务 化 应 用 。 其 中 ，HY-2 产品 应 用 于 中 国 与 


有 效 推动 海洋 科研 的 数据 驱动 方法 。 

(2) 探索 支撑 海洋 大 数据 发 展 的 重点 观测 和 探测 
计划 。 根 据 海 洋 科学 发 展 的 历史 和 现状 、 结 合 海洋 科学 
发 展 趋势 与 国家 海洋 战略 发 展 需求 ， 分 析 研 究 支 撑 未 
来 5 一 10 年 海洋 大 数据 发 展 的 重点 观测 和 探测 区 域 ， 从 
海 、 陆 、 空 、 天 、 时 5 个 维度 深入 探索 形成 海洋 大 数据 
的 关键 基础 和 能 力 。 

(3) 研究 适应 大 数据 特点 的 海洋 科学 和 信息 科学 
发 展 趋势 。 针 对 海洋 科学 的 综合 与 交叉 学 科 特 性 ， 分 析 
海洋 大 数据 在 物理 、 化 学 、 和 生物、 地质 等 主要 海洋 学 科 


欧盟 的 数值 模式 预报 及 多 源 融 合 产品 中 ， 而 高 分 辨 率 海 
面 温 度 产 品 在 马 航 失 联 客机 海上 搜救 保障 、 极 地 大 洋 航 
线 中 提供 了 重要 的 支撑 保障 "1。 

目前 ,海洋 相关 行业 都 在 积极 推动 海洋 大 数据 在 行 
业 中 的 应 用 ,关注 海洋 科学 领域 的 新 发 现 和 新 发 明 ， 并 
推动 产业 化 落地 。 然 而 ， 行 业 应 用 在 大 数据 转型 中 毕竟 
是 个 新 形态 、 新 过 程 ， 可 以 借鉴 和 参考 的 经 验 不 多 ， 海 
洋 大 数据 应 用 的 行业 落地 过 程 还 有 不 少 问 题 需要 解决 。 
随 着 大 数据 相关 技术 的 研究 不 断 取得 突破 ， 传 统 行业 如 
何 重新 审视 自己 的 发 展 战略 ， 积 极 拓 展 行业 内 部 ( 上、 
UR) 之 间 、 行 业 之 间 的 数据 更 好 地 融合 与 利用 是 海洋 
大 数据 应 用 中 的 一 项 挑战 。 


4 未 来 发 展 方向 


围绕 国家 海洋 发 展 战略 ， 明 确 未 来 5 一 10 年 海洋 大 
数据 科学 发 展 的 方向 ， 确 定海 洋 科学 领域 应 用 大 数据 的 
关键 技术 瓶 须 ， 提 出 推进 海洋 数据 科学 发 展 的 关键 步骤 
和 重点 支持 领域 ， 实 现 海 洋 数 据 从 “数据 大 ”困境 到 
“大 数据 ”时 代 的 战略 性 转变 。 

(1) 研究 海洋 科学 与 数据 科学 融合 发 展 的 主要 方向 
与 理论 。 分 析 海 洋 大 数据 的 特点 ， 结 合 海洋 科学 各 领域 
的 发 展现 状 和 趋势 ， 探 索 海 洋 科 学 与 数据 科学 融合 发 展 
的 核心 问题 ， 明 确 未 来 5— 10 年 海洋 数据 科学 的 重点 发 
展 方 向 ; 以 海洋 科研 需求 推动 数据 科研 体系 发 展 ， 建 立 


发 展 过 程 中 的 作用 和 影响 ， 探 索 海洋 大 数据 与 各 学 科 交 
又 融合 过 程 中 的 关键 技术 瓶 开 ， 以 及 云 存储 、 物 联网 、 
人 工 智能 、 泛 在 计算 、 交 互 可 视 、 混 合 现实 等 前 沿 信息 
技术 在 海洋 中 的 应 用 前 景 ， 为 构建 面向 现代 海洋 科学 的 
大 数据 分 析 学 理论 与 大 数据 海洋 学 知识 发 现 体系 提供 指 
导 。 

(4) 研究 海洋 大 数据 的 共享 机 制 和 协同 创新 平台 建 
设 需求 。 根 据 “ 海 洋 强国 ”“ 一 带 一 路 ”“ 海 陆 统筹 ” 
和 “军民 融合 ”等 国家 战略 ， 以 及 经 济 社会 发 展 对 海洋 
科学 各 领域 的 具体 需求 ， 分 析 海 洋 大 数据 的 共享 机 制 ， 
研究 建设 海洋 大 数据 协同 创新 平台 的 关键 技术 和 建设 规 
划 ， 形 成 产 、 学 、 研 、 用 的 有 机 融合 。 

(5) 探索 应 用 海洋 大 数据 的 新 兴 产 业 发 展 趋势 与 
科技 需求 。 以 大 数据 感知 、 计 算 、 信 息 产品 三 大 类 数据 
服务 为 基础 ， 围 绕 海洋 科学 、 海 洋 健康 与 生物 多 样 性 、 
全 球 气候 变化 、 海 洋 水 产品 食物 安全 、 海 洋 污 染 与 人 类 
健康 、 海 洋 灾难 与 海事 安全 、 蓝 色 经 济 等 各 个 领域 的 需 
求 ， 分 析 应 用 海洋 大 数据 的 新 兴 产 业 发 展 趋势 ， 推 进 海 
洋 科 技 与 蓝 色 经 济 的 深度 融合 。 


海洋 大 数据 时 代 的 到 来 ， 机 遇 与 挑战 并 存 。 国 际 
社会 已 经 认识 到 海洋 大 数据 科学 对 于 人 类 社会 发 展 的 重 
要 性 ， 世 界 各 国 也 意识 到 海洋 大 数据 科学 对 国家 核心 竞 
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学 科 与 领域 


争 力 的 提升 具有 重要 标志 性 意义 。 海 洋 大 数据 科学 应 从 
上 、 中 、 下 游 逐 步 攻坚 克 难 ， 真 正 将 其 发 展 成 为 保障 
“海洋 强国 ”“ 一 带 一 路 ”“ 海 陆 统筹 ”和 “军民 融 
合 ” 等 国家 战略 实施 的 重要 支撑 ， 以 及 维护 中 国 国家 与 
人 民利 益 的 重要 保障 。 
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Big Data Science for Ocean: Present and Future 
QIAN Chengcheng" CHEN Ge^" 
( 1 North China Sea Marine Forecasting Center of State Oceanic Administration, Qingdao 266061, China; 
2 College of Information Science and Engineering, Ocean University of China, Qingdao 266000, China; 
3 Laboratory for Regional Oceanography and Numerical Modeling, Qingdao National Laboratory for Marine Science and 
Technology, Qingdao 266000, China ) 
Abstract With major improvements in ocean observations and modeling, as well as in data science development, current oceanography has 
gone through three critical transformations: theory-driven, technology-driven, and data-dominant. Oceanography big data are indispensable in 
humankind’s journey to better learn the seas. The importance of big data in society development and national core competence is increasingly 
recognized by all countries. This paper addresses the overall development of big data acquiring, analysis, and application. Big data now can be 
obtained from platforms based in the space, the air, the land, and the ocean. However, breakthroughs are needed in such conditions as deep seas, 
extreme environments, and where high resolution is required. Compared to other nations, big data storage, management, and mining in China are 
relatively preliminary. On the other hand, we are leading in data visualization. Many areas are seeking for the application of ocean big data and 
paying attention to the latest discoveries. Still, connections between the applications and the upstream data acquiring and analyses are sometimes 
lost. Ocean big data have such features as being spatial-temporal coupled and geographically related when it comes to the fields of marine food 
safety, ocean pollution and mankind health, marine accidents, marine biodiversity, blue economy, etc. It is a general trend to apply ocean big data 
in the newly established fields. First, being spatial-temporal coupled is one of the most important features for air-land-sea data sets, which are also 
known as multi-dimensional data. As the observational techniques developing increasingly fast, it is getting more critical to get as high resolution 


data as possible in every dimension. Therefore, it is necessary to start analyzing the data sets from both temporal and spatial aspects, while this 
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could pose a serious challenge to the ocean big data deep analyses since multiple factors should be considered in time and space. Another character 


of air-land-sea data is that they are geographically related. Different from being randomly distributed like the big data in other areas, ocean big 
data are all influenced by adjacent pixels. Since pixels sitting close to each other typically has linear or non-linear relationships with each other, 
the models on different temporal-spatial scales are presented in different ways. As a result, it is still very challenging in terms of ocean big data 


obtaining, analysis and application. Therefore, it becomes a critical issue which needs to be addressed by closely combining oceanography and 


chinaXiv 


data field in order to deal with the scientific or technical or engineering or even humanity challenges. This study proposes the possible research 
topics and key techniques in ocean big data field in 5 to 10 years: (1) investigating the potential areas and methods of the fusion of ocean science 
and big data field; (2) exploring the possible observation plans in support of ocean big data development; (3) determining the oceanography and 
information development trends which can fit the most features of big data; (4) studying the techniques and platforms of ocean big data sharing; 
and (5) exploring the development and technical requirements of possible new areas of ocean big data applications. In the future, step by step, we 
hope to keep investigating the methods of obtaining ocean big data with high resolution in extreme conditions such as deep sea trenches, and to find 
new analyses theories and techniques to make possible breakthroughs in terms of the multi-dimensional analyses of ocean big data. We will also try 
to realize the establishment of a new platform where ocean big data can be freely shared. Another goal is to satisfy the different needs in areas like 
marine food safety, marine pollution and society health, marine accidents, biodiversity, etc. and to ensure the new ocean big data based industries 
being smoothly established. This paper will be a significant contribution in understanding the oceans and improving our marine forecast abilities. 


Keywords ocean big data, research actuality, future direction, key technologies 
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